FILTER MODE ACTIVE

#символическое рассуждение

Найдено записей: 3

#символическое рассуждение06.07.2025

AbstRaL: Повышение устойчивости LLM через абстрактное мышление и обучение с подкреплением

AbstRaL использует обучение с подкреплением для обучения LLM абстрактному мышлению, что значительно повышает их устойчивость и точность на изменённых задачах GSM8K по сравнению с традиционными методами.

#символическое рассуждение27.06.2025

Polaris-4B и Polaris-7B: масштабируемое обучение с подкреплением для продвинутого математического и логического рассуждения

Polaris-4B и Polaris-7B представляют новый рецепт обучения с подкреплением, который эффективно масштабирует способности к рассуждению, достигая передовых результатов в математических тестах с использованием небольших моделей.

#символическое рассуждение20.06.2025

PoE-World: Модульные символические модели превосходят RL-базисы в Montezuma’s Revenge с минимальными данными

PoE-World представляет модульный символический подход, который превосходит традиционные методы обучения с подкреплением в Montezuma’s Revenge с минимальными данными, обеспечивая эффективное планирование и сильное обобщение.